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摘 要 : 贝 叶 斯 统计 应 用 于 假设 检验 的 方法 斯 因子 一 一 在 心理 学 研究 中 的 应 用 日 渐 


增加 。 贝 叶 斯 因子 能 分 别 量 化 所 支持 的 相应 假设 或 模型 的 证 据 ， 进 而 根据 其 数值 大 小 做 出 


当前 数据 更 支持 哪 种 假设 或 模型 的 判断 。 然 而 ， 国 内 尚 缺 乏 对 方差 分 析 的 贝 叶 斯 因子 的 原 


理 与 应 用 的 介绍 。 基 于 此 ， 本 文 首先 介绍 贝 叶 斯 方差 分 析 的 基本 思路 及 计算 原理 ， 并 结合 


实例 数据 ， 展 示 如 何在 JASP 中 对 五 种 常用 的 心理 学 实验 设计 ( 单 因素 组 间 设 计 、 单 因素 组 


内 设计 、 二 因素 组 间 设 计 、 二 因素 组 内 设计 和 二 因素 混合 设计 ) 进 行 贝 叶 斯 方差 分 析 及 如 何 


汇报 和 解读 结果 。 贝 叶 斯 方差 分 析 提 供 了 一 个 能 有 效 蔡 代 传 统 方差 分 析 的 方案 ， 是 研究 者 


CS 进行 统计 推断 的 有 力 工具 。 


关键 词 ， 贝 叶 斯 统计 ， 贝 叶 斯 因子 ， 方 差分 析 ;JASP 


p 
au 
u$ 


方差 分 析 (ANOVA) 这 一 统计 方法 适用 于 评估 分 类 型 预测 变量 ( 自 变 量 ) 对 连续 型 结果 变 


量 ( 因 变量 ) 的 影响 ， 是 实验 心理 学 中 常用 的 统计 方法 (Fritz et al., 2012)。 在 零 假 设 显著 性 检 


验 (nullhypothesis significance testing, NHST) 的 框架 下 ， 方 差分 析 得 到 的 结果 会 根据 p 值 进行 


统计 显著 性 推断 : 当 设 定 了 p ERRE. WAREZ p 值 ， 以 全 或 无 的 方式 推断 结 


* 通讯 作者 : 胡 传 鹏 ， 男 ， 博 士 ， 南 京师 范 大 学 心理 学 院 教授 ，E-mail: hcp4715@hotmail.com 
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5 
N 


理 


是 ， 


此 ， 贝 叶 斯 统计 (Bayesian statistics) 作 为 一 种 蔡 代 NHST 的 方法 ， 


注 (Wagenmakers et al., 2011)。 


贝 叶 斯 统计 的 基本 


田 相 


4PA vay 


如 果 p > 0.05， 就 说 明 结 果 不 具 有 统计 显著 性 。 这 种 二 


。 例 如 ， 如 果 p < 0.05， 就 说 明 结 果 上 有 具有 统计 显著 性 ， 应 当 


分 


TOI 


的 观点 受到 了 广泛 质疑 ， 并 


ANS 


名 零 假 设 (有 0); 


这 也 


学 可 重复 性 危机 的 来 源 之 一 (Open Science Collaboration, 2015; Schmalz et al., 2021). 


逐渐 受到 了 研究 者 的 关 


是 随 着 观测 数据 的 积累 ， 信 念 (知识 经 验 ) 不 断 更 新 的 过 程 


(Faulkenberry et al., 2020; van den Bergh et al., 2020; Wagenmakers, Marsman, et al., 2018)。 研 


究 者 在 进行 假 


的 估计 。 当 某 个 假设 


假设 对 观测 数据 的 预测 特 


comparison) 的 方式 来 得 


许 岳 


设 检验 前 可 能 会 


得 到 支持 H 和 Ho Wil 


fut 等 , 2022)。 


PAW) 


有 EE 


TT 


=> 


民 差 


民 好 的 预测 数据 时 ， 


EH, à 


到 贝 叶 斯 


因子 (Bayes 


=| 
FA 


然 贝 叶 斯 


统计 具有 量 


多 个 相互 竞争 的 假设 ， 信 


时 ， 信 念 就 会 减弱 。 因 此 通过 


而 量化 两 种 假设 相对 


与 该 假设 一 致 的 信念 会 


bt 现 的 可 能 性 ， 即 通 


factors, BF; 胡 传 鹏 等 


念 即 是 对 各 个 假设 为 真 的 可 


过 模型 


, 2018; 李 贵 了 


得 到 增强 ， 反 之 ， 当 某 


贝 叶 斯 统计 ， 研 究 者 可 以 分 别 


比较 (model 


K, Nr, 2021; 


REXY Ai 和 而 的 支持 程度 、 不 依赖 于 抽样 计划 等 


优势 (Griinwald et al., 2020; Hendriksen et al., 2021; Schmalz et al., 2021; Wagenmakers, Marsman, 


et al., 2018), {H 


界面 的 软件 


相 比 于 频率 主义 ANOVA, Jl FH it ANOVA 的 应 


(例如 ，JASP) 的 开发 ，BF 的 使 用 变 得 


是 有 限 的 。 随 着 具有 图 形 
更 加 简便 ， 因 此 也 开始 被 广泛 应 用 于 心理 


学 的 各 个 领域 (和 孟 迎 芳 等 , 2021; Brydges & Gaeta, 2019; Derks et al., 2021; Rouder et al., 2017; 


Wagenmakers, Love, et al., 2018). 


M42018) 3c 4 


H 3.1 部 分 


先前 亦 


中 文 文献 对 JASP 进行 了 相关 介 乡 


(Kruschke & Liddell, 2018; Schmalz et al., 2021; Tendeiro & Kiers, 2019). 


然而 ， 在 先前 关于 BF 的 中 文 介绍 中 
吴 凡 等 , 2018)。 虽 然 容易 理解 ， 但 无 法 应 月 


mi 


昌 于 方差 分 析 的 情境 


， 例 如 ， 胡 传 


。 如 果 需 要 了 解 更 多 关于 NHST 与 BF 的 内 容 ， 可 参考 前 人 研究 


， 多 以 相关 分 析 和 上 检验 作为 例子 ( 胡 传 鹏 等 , 2018; 


。 主 要 原因 之 一 在 于 ， 贝 
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叶 斯 ANOVA 以 贝 叶 斯 的 线性 模型 (linear model, LM) 为 基础 (Liang et al., 2008; Rouder et al., 


2012)。 虽 然 也 可 以 使 用 贝 叶 斯 广义 线性 模型 (Generalized linear model, GLM)， 但 当前 版 本 


的 JASP 并 不 能 进行 贝 叶 斯 GLM 的 相关 计算 。 贝 叶 大 


互 之 间 的 比较 获得 BF 值 。 不 同 模型 可 能 涉及 到 不 同 


叶 斯 ! 检 验 ， 模 型 比较 的 过 程 更 为 复杂 。 此 外 ， 随 着 


ANOVA 通过 多 个 不 同 的 线性 模型 相 


的 模型 构建 方式 ， 这 就 导致 了 相 比 于 贝 


自 变量 的 增加 ， 模 型 比较 及 之 后 产生 的 


模型 选择 不 确定 性 的 问题 会 对 研究 者 汇报 和 解释 结果 造成 困扰 。 因 此 ， 如 何 解决 这 种 情况 


下 的 BF 计算 与 解读 ， 也 需要 额外 的 知识 。 为 解决 研究 者 在 使 用 贝 叶 斯 ANOVA 时 可 能 出 现 


的 上 述 问 


& 


\ 


ù 


本 文 将 介绍 贝 叶 斯 线性 模型 及 模型 比较 的 基础 知识 ， 并 介绍 贝 叶 斯 模型 平均 


法 (Bayesian model averaging, BMA) 这 一 解决 自 变 量 较 多 时 如 何 计算 贝 叶 斯 因子 的 方法 。 为 


了 方便 没有 代码 基础 的 研究 者 执行 数据 分 析 ， 本 文 使 用 了 JASP 这 球 开源 、 免 费 和 具有 图 形 


界面 的 统计 软件 (JASP team, 2022)。 如 果 读 者 仅 关 注 如 何 使 用 JASP 来 进行 贝 叶 斯 ANOVA 


分 析 ， 以 及 如 何 解释 和 汇报 输出 的 结果 ， 可 跳 过 本 文 的 2.2 小 节 。 


2 “基本 概念 


2.1 贝 叶 斯 因子 


BF 是 一 种 模型 比较 和 选择 的 方法 ， 反 映 了 对 某 一 模型 支持 程度 的 量化 (Schmalz et al., 


2021)。 它 等 价 于 观测 数据 中 两 个 模型 的 边际 似 然 之 比 (marginal likelihood ratios; Heck et al., 


2022)。 在 应 用 于 假设 检验 中 时 ， 假 设 之 间 的 比较 可 视 作 模 型 之 间 的 比较 。 因 此 ，BF 可 用 


来 衡量 对 Hy 和 Fo 的 支持 程度 。 具 体 而 言 ， 将 Mts 


定 为 零 模 型 aull model)Mo 并 将 本 指定 


为 备 择 模型 (alternative model)M1。BFio 表 示 相 对 于 Mo， 观 测 数据 对 Mi 的 支持 程度 。 例 如 ， 


BF = 12 表示 观测 数据 支持 已 为 真 的 程度 是 支持 Fo 为 真 的 程度 的 12 f. WK 1 所 示 ， 参 


考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 划分 ( 胡 传 鹏 等 , 2018; Jarosz & Wiley, 2014; 
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Jeffreys, 1961; Wetzels et al., 2011), BFio= 12 可 被 解释 为 观测 数据 提供 了 较 强 的 证 据 支 持 AY 


为 真 。 反 之 ，BFo1= 12 可 被 解释 为 观测 数据 提供 了 较 强 的 证 据 支 持 Ho A 


K 1 BFio 数 值 划 分 及 其 代表 意义 


BFio 代表 意义 
> 100 极 强 的 证 据 支 持 Ay 
30— 100 非常 强 的 证 据 支持 本 
10-30 较 强 的 证 据 支 持 Hi 
3-10 中 等 程度 的 证 据 支 持 Hi 
1-3 较 弱 的 证 据 支 持 Hi 
1 无 证 据 
1/3-1 较 弱 的 证 据 支 持 Ho 
1/10 — 1/3 中 等 程度 的 证 据 支 持 Ho 
1/30 — 1/10 较 强 的 证 据 支 持 Ho 
1/100 — 1/30 非常 强 的 证 据 支 持 Ho 
< 1/100 极 强 的 证 据 支 持 Ho 
BF 计算 的 一 般 公 式 为 : 
data|M. 
oe Paani) ” 


BN, ， 见 在 线 


a 


同 理 。 因 此 ，BFio 反 映 了 两 个 模型 的 边际 似 然 之 比 。 关 于 上 式 的 进一步 


补充 材料 A( 在 线 补充 材料 详 见 https://osf.io/7caju/)。 


2.2 贝 叶 斯 ANOVA 中 线性 模型 的 比较 


要 理解 BF 在 ANOVA 中 的 应 用 ， 首 先 需要 理解 方差 分 析 与 线性 模型 的 关系 ， 原 因 在 于 


贝 叶 斯 ANOVA 中 BF 值 的 计算 是 基于 不 同 线性 模型 之 间 的 比较 。 作 为 线性 模型 的 一 种 特殊 


ÉR, ANOVA 涉及 的 自 变 量 是 分 类 变量 ， 因 变量 是 连续 变量 ， 且 误差 项 (error) 需 要 满足 正 


态 分 布 。 它 的 特殊 之 处 在 于 : 由 于 自 变量 为 分 类 变量 (例如 ， 性 别 、 不 同 实 验 条 件 等 )， 其 


Wit FE BE (design matrix) 中 包含 的 元 素 均 为 0 或 1。 线性 模型 的 一 般 形式 为 : 
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EH, YRR 


i 属于 组 j; HARRAREN, MEAKA 


ym 


Yi; = M+ PaXi + + PjXij te; (i= 1,2,...,n) 


1H 因 变 量 无 法 被 自 变量 解释 的 部 分 。 


2) 


变量 ， 即 j 组 个 体 i 的 数据 ，Xij 表 示 自 变量 ， 取 值 为 0 或 1， 代 表 个 体 


的 效应 ; 4 表示 截 距 项 ，e@ij 表 示 随 机 误差 ， 


假设 存在 一 个 两 水 平 的 自 变 量 A， 且 为 了 使 参数 不 受 计量 单位 的 影响 ， 需 要 将 参数 进 


行 标准 化 9 = (oa 代表 标准 误 )， 即 转化 为 效应 量 (effect size). 


那么 计算 A 存在 效应 的 线性 模型 可 写成 : 


Hy:Y =u+o0xX +e 


不 包括 A 效应 的 零 模型 写作 : 


Hyp: Y =u+e 


如 果 研 究 者 关注 A 的 主 效应 ， 在 传统 的 ANOVA 中 ， 可 以 通过 方差 分 解 的 方式 来 计算 


3) 


4) 


F (BAN pE, PERBERA ERMER PET SCT HEMT. FE BF 分 析 中 ， 研 究 者 是 计算 当 


前 数据 


现在 Ho 和 这 两 个 模型 下 的 可 能 愧 


的 比例 。 也 就 是 说 ， 研 究 者 将 认为 A 了 


效应 


存在 的 M 指定 为 M, WA A 主 效应 不 存在 的 M 指定 为 Mo， 通 过 模型 比较 的 方式 来 计算 


出 数据 支持 两 个 模型 可 能 性 的 比值 ， 得 到 BF 0 BK BFoi。 


上 述 内 容 描 述 的 是 仅 有 一 个 自 变 量 的 情况 。 当 存在 两 个 自 变 


地 


Xs。 和 Xb 时 ， 潜 在 线性 


模型 的 数量 增加 。 从 完全 不 包括 任何 自 变 量 效应 的 模型 ( 零 模型 ) 到 包括 全 部 自 变 量 效应 的 


模型 (两 个 自 变 量 的 主 效应 及 其 交互 作用 ， 即 全 模型 )， 共 包括 5 个 模型 (模型 的 构建 请 见 补 


充 材 料 B)。 如 果 以 零 模 型 作为 了 夯 的 模型 ， 则 与 传统 的 ANOVA 仅 有 两 主 效应 与 一 个 交互 作 
的 下 值 (及 p 值 ) 不 同 ，BF 分 析 中 会 报告 4 个 BF 值 。 这 是 因为 仅 包 括 两 个 主 效应 但 无 交互 


芷 用 的 模型 ( 见 线 上 补充 材料 B 中 的 公式 12) 也 会 与 零 模型 进行 比较 从 而 得 到 BF 值 。 并 且 ， 


包括 交互 作用 的 模型 也 同时 包括 两 个 主 效应 ， 而 非 单纯 地 只 包括 交互 作用 。 此 外 如 果 研究 
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者 想 计算 交互 作用 所 对 应 的 BF 值 ， 可 以 应 用 BF 的 传递 性 (Srinivasan & Vijayaragunathan, 


2021; Wagenmakers et al., 2010)。 具 体 计算 原理 请 见 补充 材料 C。 


由 此 可 见 ， 随 着 自 变量 个 数 的 增加 ， 模 型 的 数量 也 会 迅速 增加 。 这 就 导致 研究 者 很 难 


单独 地 考虑 每 个 模型 的 效应 。 同 时 ， 模 型 两 两 比较 产生 的 BF 数量 也 随 之 增加 ， 这 会 对 研究 


者 解释 结果 造成 困扰 。 当 琴 选择 不 同 的 模型 时 ， 与 Ho 对 应 的 原 模型 比较 产生 可 能 会 产生 几 


个 数值 相似 的 BFio 时 ( 即 有 相同 程度 的 证 据 支 持 几 个 模型 作为 H1)， 研 究 者 该 如 何 选择 合适 


的 模型 作为 Hi 进而 得 出 结论 ?” 当 实验 中 存在 2 个 自 变 量 时 ， 可 供 包 选择 的 备 择 模型 有 4 个 ; 


当 存 在 3 个 自 变 量 时 ， 可 供 选 择 的 备 择 模 型 就 增长 到 了 18 个 。 由 此 可 见 ， 传 统 ANOVA 得 


BES FEM p ERRED F BF 的 数量 。 这 就 造成 了 研究 者 在 模型 选择 上 会 出 现 困 难 。 研 究 


者 甚至 可 能 会 为 了 追求 BF 值 最 大 化 ， 选 取 特定 的 模型 ， 从 而 忽略 了 模型 选择 的 不 确定 性 。 


据 此 ， 研 究 者 提出 使 用 贝 叶 斯 模型 平均 (Bayesian model averaging, BMA) 的 方法 来 解决 这 一 


问题 (Heck & Bockting, 2021; Heck et al., 2022; Hinne et al., 2020; van den Bergh et al., 2020; 


Wagenmakers, Love, et al., 2018)。 关 于 BMA 的 详细 信息 请 见 在 线 补充 材料 D。 


2.3 JASP 中 进行 贝 叶 斯 ANOVA 


本 文 使 用 的 JASP 版 本 为 0.16.3(JASP Team, 2022)， 所 用 示例 数据 及 分 析 结 果 可 在 OSF 


上 获取 (https://osf.io/7caju/)。JASP 是 一 个 不 断 开 发 中 的 软件 ， 开 发 者 不 断 地 改进 该 软件 并 


旦 修复 现 有 版 本 中 的 问题 。 因 此 ， 我 们 推荐 读者 使 用 最 新 版 的 JASP 而 非 一 定 要 使 用 本 版 


本 。JASP 使 用 RR 中 的 BayesFactor 包 (Morey & Rouder, 2022) 计 算 BF。 在 进行 贝 叶 斯 ANOVA 


前 ， 研 究 者 需要 进行 的 基本 步骤 是 : 指定 自 变量 和 因 变 量 、 选 择 输出 的 BF 形式。 如果 是 多 


自 变 量 的 实验 设计 ， 还 需 设置 BFincy 的 输出 形式 。 


不 同 于 传统 ANOVA 的 输出 指标 (F, p, 12 等 )， 在 JASP 中 进行 贝 叶 斯 ANOVA 后 ， 会 输 
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出 如 下 指标 ( 见 图 2): Model Comparison 为 模型 比较 的 结果 汇总 表 ; P(M) 表 示 获 得 观测 数据 


前 模型 的 先 验 概 率 ， 在 默认 的 Uniform 分 布 中 每 个 模型 的 先 验 概率 相同 ， 即 如 果 有 m 个 模 


型 ， 每 个 模型 的 先 验 概率 就 为 /m; P(M|data) 表 示 获 得 数据 后 模型 的 后 验 概 率 ，BFm 表 示 


当前 模型 从 先 验 到 后 验 的 变化 : 


P(M|data) 1— P(M) 


BE a a A pees ln 
m= PMl]data) PM) 


5) 


Error % 表 示 结 果 的 变异 系数 。 由 于 在 计算 过 程 中 使 用 了 MCMC 采样 ， 因 此 每 重新 运 


= 行 一 次 分 析 ， 结 果 都 可 能 会 出 现 细微 的 差异 。 因 此 ， 按 照 本 文 步骤 ， 读 者 所 做 的 贝 叶 斯 


ANOVA 结果 可 能 会 与 本 文 得 到 的 结果 有 细微 不 同 。 结 果 的 波动 可 用 Eror % 来 量化 ，Error % 


越 高 说 明 结果 的 波动 性 越 高 。van Doorn 等 (2021) 推 荐 Error % 小 于 20% 时 通常 是 可 以 接受 


的 。 


T 3 ”使 用 JASP 进行 贝 叶 斯 ANOVA 实例 展示 


3.1 单 因 素 方差 分 析 


示例 数据 。 使 用 疼痛 阔 限 (Pain Thresholds) 数 据 作 为 示例 ， 该 数据 来 自 单 因 素 组 间 设 计 


的 实验 。 自 变量 为 发 色 (Hair Color)， 包 括 4 个 水 平 ( 见 图 1): 深 色 黑 发 (Dark Brunette)、 深 色 


金发 (Dark Blond)、 浅 色 金 发 (Light Blond)、 浅 色 黑 发 (Light Brunette)。 因 变量 为 疼痛 容忍 度 


(Pain Tolerance)。 因 此 在 本 例 中 ，#f AREA UR CHI, Ay AA PS BR A 


响 。 例 如 ， 浅 色 金 发 个 体 对 疼痛 的 容忍 度 要 高 于 浅 色 黑 发 个 体 。 
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90 ~ 
80 ~ 
70 - 
60 一 
50 — 
40 - 
30 7 
20 一 
10 — 


Pain Tolerance 


bta 


| | | | 
Dark Blond Dark Brunette Light Blond Light Brunette 


Hair Color 


图 1 JASP 中 示例 数据 疼痛 阀 限 的 描述 统计 结果 


操作 步 又。 首先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA - Pain Thresholds), 


然后 在 ANOVA 面板 中 选择 “Bayesian AVOVA”。 之 后 需要 进行 以 下 步骤 ( 见 图 2): 第 一 ， 将 


疼痛 容忍 度 作为 因 变 量 放 入 “Dependent Variable” 中 ， 将 发 色 作为 自 变 量 放 入 “Fixed Factors” 


中 ; 第 二 ， 在 “Bayes Factor” 选 项 框 中 选择 要 输出 的 BF 形式 ; 第 三 ， 在 “order” 选 项 框 中 选 


择 模型 比较 的 顺序 ， 即 确定 模型 是 与 零 模型 (null modeD 还 是 与 最 优 模型 (best model) 进 行 比 


较 。 如 果 选 择 “compare to best model”*”， 那 么 “Model Comparison”* 中 呈现 结果 的 第 一 行 就 代表 


最 优 模型 与 其 自身 比较 的 结果 。 反 之 ， 如 果 选 择 “compare to null model”, MA HRA 


型 与 其 自身 比较 的 结果 。 因 此 “order ”的 选择 对 结果 没有 实际 影响 ， 第 四 ， 


由 于 该 示例 数据 


中 的 自 变量 发 色 是 一 个 四 水 平 组 间 变 量 ， 因 此 需要 事后 检验 (Post Hoc Tests) 来 观测 差异 究竟 


出 现在 哪 两 个 水 平 之 间 。 然 而 ， 事 后 检验 本 身 是 一 个 探索 性 的 分 析 过 程 。 


研究 者 在 进行 数据 分 析 前 ， 需 要 做 出 明确 假设 。 


因此 ， 本 文 建议 


贝 叶 斯 方差 分 析 中 的 事后 检验 无 需 进行 校正 (Gelman et al., 2012)。 不 同 于 依赖 预 设 显著 
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性 水 平 以 及 p 值 的 NHST， 贝 叶 斯 方差 分 析 关 注 参 数 或 模型 的 后 验 分 布 及 观测 数据 对 不 同 


假设 的 支持 程度 。 贝 叶 斯 方差 分 析 提 供 了 完整 的 后 验 分 布 ， 使 得 研究 者 可 以 直接 对 不 同 模 


型 的 后 验 分 布 进行 比较 。 并 且 ， 贝 叶 斯 方差 分 析 允 许 研究 者 设 定 不 同 的 先 验 分 布 形式 ， 来 


反映 对 不 同 假设 的 先 验 信念 。 贝 叶 斯 


子 的 本 质 是 两 个 模型 边际 似 然 的 比值 ， 量 化 了 对 模 


型 的 相对 支持 程度 ， 直 观 的 对 模型 进行 了 比较 。 综 上 ， 在 贝 叶 斯 方差 分 析 中 无 需 使 用 多 重 


比较 校正 。 
il E ”区区 ”中 ”人 区 


7 


Descriptives && T-Tests ANOVA Mixed Models Regression Frequencies Factor JAGS LearnBayes Machine Learning Meta-Analysis Reliability SEM 
av Dependent Variable Bayesian ANOVA 
Le Ñ, Pain Tolerance 
EO Model Comparison 
Pp & Hair Color 
Models PM) P(uicata) BFM BF10 error % 
: 1 $| Nul model 0.500 0.077 0.084 1.000 
Hair Color 0.500 0.923 11969 11.959 0.004 
1 
Post Hoc Tests 
Random Factors 
> Post Hoc Comparisons - Hair Color 
Prior Odds Posterior Oodds BF to,u error % 
Dark Blond Dark Brunette 0.414 0.904 2484 2754e-5 
Light Blond 0.414 0.362 0.875 0.004 
4 4 Light Brunette 0.414 0.433 1.045 oon 
r Dark Brunette Light Blond 0.414 4506 10.878 4.24de-6 
l Light Brunette 0.414 0.200 0.700 0.002 
Light Blond Light Brunette 0.414 1931 4.681 0.003 
Eye Fado Note. The posterior odds have been corrected for multiple testing by fixing to 0.5 the prior 
O BF。 probability that the null hypothesis holds across all comparisons (Westfall, Johnson, & Utts, 1997). 
Individual comparisons are based on the default t-test with a Cauchy (0, r= 1/sqrt(2)) prior. The "U" 
BFw all models in the Bayes factor denotes that it is uncorrected. 
Log(BFe) Across matched models 
Estimates 
这 Descriptives 
Model averaged Fe 
: Descriptives ? Descriptives plots 
Credible interval 95.0  % 
Order Plots 
70 
Compare to best model Model averaged posteriors 
© Compare to nuli model | 3 Groun levels in single plot ead T 
Individnal nint nar l = i 
z r sH A Aa S 、 
2 使 用 JASP 进行 单 因素 方差 分 析 的 操作 截屏 
pi 
Compare to best model Model averaged posteriors Bayesian ANOVA 


© Compare to null modol Group levels 


vidual plot 
Model Comparison 


Q-Q plot of residuals 
Models PM) P(Mldata) BFw BF10 error % 
: Posterior R? . 
: $| Nul model 0.500 0.077 0.084 4.000 
Hair Color 0.500 0.923 11.969 11.969 0.004 


> Model 


> Single Model inference 
Post Hoc Tests 


| W Post Hoc Tests Post Hac Comparisons - Hair Color 


Prior Odds PosterorOdds BFio,u error % 


la & Hair Color 
Dark Blond Dark Brunette 0.414 0.904 2484 27540-5 
Light Blond 0.414 0.362 0.875 0.004 
4 4 4 Light Brunette 0.414 0.433 1.045 0.011 
Dark Brunette Light Blond 0.414 4.506 10.878  4244e-6 
Light Brunette 0.414 0.290 0.700 0.002 
Light Blond Light Brunette 0.414 1931 4.661 0.003 
Note The posterior odds have been corrected for multiple testing by Toing to 0.5 the prior 
probability that the null hypothesis holds across all comparisons (Westfall, Johnson, & Utts, 1997). 
Individual comparisons are based on the default (test with a Cauchy (0, r = 1/sqri(2)) prior. The "U" 
in the Bayes factor denotes that it is uncorrected. 
Correction Deini 
@ Null controt jescriptives 
. 
` ` Descriptives plots 
> Descriptives Plots 
> Raincloud Plots 70- 
Pp Additonal Options 
eo- | | 


图 3 使 用 JASP 进行 事后 检验 的 操作 
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结果 汇报 。 贝 叶 斯 ANOVA 的 结果 显示 : 参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011)， 贝 叶 斯 因子 BFini= 11.97， 说 


明 在 当前 数据 中 到 出 现 的 可 能 性 是 Ao 的 11.97 倍 。 这 是 较 强 的 证 据 支 持 了 Ho WAIE 


色 的 个 体 


Blond) 对 


着 不 同 的 疼痛 容忍 度 。 通 过 事后 检验 发 现 ， 当 前 数据 中 出 现 浅 色 金发 个 体 (Light 


疼痛 的 容忍 度 高 于 深 色 黑 发 个 体 (Dark Brunette) 的 可 能 性 是 二 者 无 差异 的 10.88 倍 


(BFio= 10.88， 较 强 证 据 支持 H); 浅 色 金 发 个 体 (Light Blond) 对 疼痛 的 容忍 度 高 于 浅 色 黑 发 


个 体 (Light Brunette; BFio= 4.66， 中 等 程度 证 据 支 持 Ai); 深 色 金发 个 体 (Dark Blond) 对 疼痛 


的 容忍 度 高 于 深 色 黑 发 个 体 (BFio= 2.18， 较 弱 证 据 支 持 所 );， 其 余 条 件 两 两 比较 之 间 无 证 据 


支持 存在 差异 或 者 不 存在 差异 (BFio 均 小 于 1.05)。 


3.2 二 因素 方差 分 析 


示例 数据 。 使 用 心率 (Heart Rate) 数 据 作 为 示例 ， 该 数据 来 自 2x2 组 间 设 计 的 实验 。 自 


变量 是 性 别 (Gender) 和 组 别 (Group)， 因 变量 为 运动 六 分 钟 后 的 心率 ( 见 图 4)。 因 此 在 本 例 中 ， 


Ho 为 不 同 的 性 别 和 组 别 对 心率 的 影响 无 显著 差异 ，Hi 为 性 别 和 组 别 不 仅 存在 主 效应 ， 且 二 
者 的 交互 作用 也 存在 。 
250 ~ 180 ~ 
1604 ° 
g] Le @ 140- 4 
rd “eo È 120- 
ge | - - B 100 - l : 
= I 80 - o A 
100 4 a 
e 60 4 
50 - 40 ~ F 
Female Male Female Male 
Gender Gender 
Control Runners 


4 JASP 中 示例 数据 心率 的 描述 统计 结果 
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操作 步骤 。 首 先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA - 


在 ANOVA 面板 中 选择 “Bayesian AVOVA”。 之 后 需要 进行 以 下 步骤 : 第 一 ， 将 心率 作为 因 


Heart Rate), “Ja 


变量 放 入 “Dependent Variable" 中 ， 将 性 别 和 组 别 作为 自 变 量 放 入 “Fixed Factor” P; 第 二 ， 


在 “Bayes Factor” 选 项 框 中 选择 BFio 作为 要 输出 的 BF 的 形式 ;第 三 ， 在 : 


‘order” 选 项 框 中 选 


#£ “compare to null model”; 第 四 ， 在 多 因素 实验 设计 中 ， 如 果 需 要 计算 BFinc/， 就 需要 勾 选 


“Effects”*。 并 且 选 择 “Across all models” Fl“ Across matched models”* 方 法 所 计算 出 的 BFiwa 是 不 


同 的 。 本 文 建议 采取 Sebastiaan Math6t 提倡 的 “Across matched models” 方 法 计算 的 结果 ( 见 图 


5A); 第 五 ， 由 于 贝 叶 斯 ANOVA 没有 简单 效应 分 析 的 模块 ， 如 果 研 究 中 需要 进行 进一步 简 


单 效应 分 析 ， 可 通过 贝 叶 斯 1 检验 进行 简单 效应 分 析 。 


具体 而 言 ，“Effects” 的 选择 会 影响 BFia 的 计算 。 在 进行 BFina 的 计算 前 ， 首 先 要 了 解 


如 何 计算 P(incl)、P(excl)、P(inclldata) 和 P(exclldata)。 在 JASP 中 ， 这 四 个 值 的 计算 有 


两 种 ;包括 所 有 模型 的 取向 (across all models) 和 包括 匹配 模型 的 取向 (across matched models). 


两 种 取向 的 选择 在 JASP 中 的 操作 见 图 SA。 这 两 种 取向 之 下 的 计算 公式 有 所 区 别 ， 有 具体 计 


算 过 程 见 在 线 补充 材料 E。 
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A Y Bayesian ANOVA 


Bayes Factor 
O BF. 
BF。 

Log(BFJ) 


Order 


Compare to best model 


& Gender 
& Group 


Tables 
O Effects 
Across all models 
© Across matched models 


Estimates 
Model averaged R? 
Descriptives 

Credible interval 950  % 


Model averaged posteriors 


Bayesian ANOVA ¥ 
Dependent Variable 
$ Heart Rate 


Model Comparison Y 


Fixed Factors 


P(M) 


P(Midata) BFio 


Gender 


‘Null model 
Gender + Group + Gender * Group 
Gender + Group 


2.130e-126 e- 1.000 
0.814 3.822e+125 
0.186 8.728e+124 
6212e-36 2.485e-35 2916e+90 
1.678e-107 6.711e-107 7.876e+18 2.129e-25 


Analysis of Effects - Heart Rate 


Effects 


Plexcl) Plinclldata) P(exclldata) BF inc 


Gender 
Group 


Gender %: Group 


Analysis of Effects - Heart Rate 


0.400 
0.400 
0.800 


1.910e-14 3.491e+13 
1.910e-14 3.491e+13 
17.513 


Effects 


Plexcl) 


P(incl|data) 。 P(excl|data) BFing 


Gender 


Group 

Gender « Group 
Note. Compares models that contain the effect to equivalent models stripped of the effect. 
Higher-order interactions are excluded. Analysis suggested by Sebastiaan Mathôt. 


0.400 
0.400 
0.200 


0.186 6.212e-36 2.993e+34 
0186 1.678e-107 1.108e+106 
0.814 0.186 4378 


图 5 A 为 选择 “Effects”; B 为 选择 Across all models 方法 后 的 BFinu 输 出 结果 ; C 为 选择 


Across matched models 方法 后 的 BFina 输 出 


结果 汇报 。 贝 叶 斯 ANOVA 的 结果 显示 : 参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011)， 当 前 数据 存在 极 强 的 证 据 支 持 


性 别 主 效应 (BFina = 2.99x1030 和 组 别 主 效应 (BFiau = 1.11x101%) 的 存在 。 女 性 运动 六 分 钟 后 


的 心率 0M = 131.99, SD = 22.72) 高 于 男性 (M = 116.99, SD = 19.84)， 控 制 组 运动 六 分 钟 后 的 心 


Z(M = 139.00, SD = 18.95) 高 于 跑步 组 (M = 109.98, SD = 15.53)。 当 前 数据 存在 中 等 程度 的 证 


据 支 持 性 别 和 组 别 间 交互 作 月 


分 别 对 控制 组 和 跑步 组 进 


日 的 存在 (BFino = 4.38)。 


行 贝 叶 斯 独立 样本 :检验 ， 结 果 显 示 : 在 控制 组 中 ， 女 性 运动 


六 分 钟 后 的 心率 高 于 男性 (BFio= 5.56x10”); 在 跑步 组 中 ， 女 性 运动 六 分 钟 的 心率 高 于 男性 


(BFi0= 5.48x10'). 


3.3 单 因 素 重 复 测 量 方差 分 析 


示例 数据 。 使 用 来 自 于 单 因 
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素 组 内 设计 实验 的 Bush Tucker Food 数据 作为 示例 。 自 变 


la 


是 食物 种 类 ， 因 变量 为 吃 下 食物 后 感到 反胃 需要 的 时 间 ( 秒 )。 数 据 的 组 织 形式 采用 宽 数 


据 (wide data) 的 形式 ， 与 SPSS 中 进行 分 析 时 的 数据 组 织 形式 相同 。 


操作 步骤 。 首 先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA -Bush Tucker Food), 


然后 在 ANOVA 面板 中 选择 “Bayesian Repeated Measures AVOVA”。 之 后 需要 进行 以 下 步 又 


( 见 图 0): 第 一 ， 设 置 新 的 重复 测量 因子 ， 为 每 个 水 平 进 行 命名 ;第 二 ， 在 “Bayes Factori 


项 框 中 选择 BF 作为 要 输出 的 BF 的 形式 ; 第 三 ， 在 “order” 选 项 框 中 选择 “compare to null 


model”; 第 四 ， 由 于 该 示例 数据 中 的 自 变 量 食物 种 类 是 一 个 四 水 平 组 内 变量 ， 因 此 需要 事 


由 


后 检验 来 观测 差异 究竟 出 现在 哪 两 个 水 平 之 间 。 


结果 汇报 。 对 结果 的 汇报 可 以 参考 先前 对 单 因 素 方差 分 析 的 汇报 形式 。 


| Acetebrty |$ stickinsect | $ Kangaroo Testice | Fish Eye | $ Wichety Grub | | | | 
| | Y Bayesian Repeated Measures ANOVA 60000 


& Colebrity Repeated Measures Factors 
Animal 

Stick Insect 

Kangaroo Testicle 

Fish Eye 

Witchetty Grub 

New Level 


x 


8 
9 
6 
5 
8 
7 


x 


10 


ale [v olo æl ojo 


1 
2 
3 
1 
5 
6 
$ 
8 


ojn alalolrwlalw 


p New Factor 
Repeated Measures Cells 

> Stick Insect Stick Insect 
Kangaroo Testicle Kangaroo Testicle 
Fish Eye Fish Eye 
Witchetty Grub Witchetty Grub 


Between Subject Factors 


图 6 使 用 JASP 进行 单 因素 重复 测量 方差 分 析 的 操作 截屏 


3.4 二 因素 重复 测量 方差 分 析 


3.4.1 ”实验 设计 为 组 内 设计 


示例 数据 。 酒 精 态度 (Alcohol Attitudes) 采 用 的 是 3x3 组 内 设计 。 自 变量 是 图 片 效 价 


NI 
iH 
K 


(Imagery) 和 饮品 种 类 (Drink)， 三 个 水 平 ， 因 变量 为 被 试 在 观看 图 片 后 对 饮品 的 态度 评 
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分 ( 见 图 7). 
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7 示例 数据 酒精 态度 的 描述 统计 结果 


操作 步骤 。 首 先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA - Alcohol Attitudes), 


然后 在 ANOVA 面板 中 选择 “Bayesian Repeated Measures AVOVA”。 之 后 需要 进行 以 下 步骤 


( 见 图 8): 第 一 ， 设 置 两 个 重复 测量 因子 并 对 不 同 因子 的 不 同 水 平 进行 命名 ; 第 二 ， 在 


“Bayes Factor” 选 项 框 中 选择 BFio 作 为 要 输出 的 贝 叶 斯 因子 的 形式 ;第 三 ， 在 “order” 选 项 框 


中 选择 “compare to null model”; 第 四 ， 在 “Tables” 选 项 框 中 勾 选 “Across matched models” 来 


计算 BFina; 第 五 ， 由 于 贝 叶 斯 ANOVA 没有 简单 效应 分 析 的 模块 ， 因 此 需要 通过 贝 叶 斯 1 


检验 进行 简单 效应 分 析 。 
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Bayesian Repeated Measures ANOVA 
Drink 


Beer Modal Comparison 
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Effects ind) Pexc) Pfndldata)  P(excl]data) ine 
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wineneut Wine,Neutral Arer onder hor are Coe naval oaaae by Sebeka Wl 
> Between Subject Factors 4 
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PriorOdde Pesterior Odds BFiou emor% 
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O BF. @ Effects 
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BFw Across al modols Negativo 0.587 16140418 27480418 15420-22 
Neutral Negative 0587 2M2e+8  3595e+3 _ 2854e-14 
Log(BF»o) © Across matched models 
Estimates 


图 8 使 用 JASP 进行 二 因素 重复 测量 方差 分 析 的 操作 截屏 


ba 


结果 汇报 。 贝 叶 斯 ANOVA 的 结果 显示 : 参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011)， 当 前 数据 存在 中 等 程度 的 证 据 


j 


支持 饮品 种 类 主 效 应 (BFina= 5.01) 和 极 强 的 证 据 支 持 图 片 效 价 主 效应 (BFina= 1.25x1019 的 存 


在 。 


dat 


事后 检验 发 现 ， 水 的 态度 得 分 低 于 啤酒 (BFo= 69.09) 和 红酒 (BFio= 66.63)， 啤 酒 和 红酒 


的 态度 得 分 无 差异 (BFio = 0.46); 积极 图 片 的 态度 得 分 高 于 消极 图 片 (BFio = 2.75x10) 和 中 


TT 


性 


图 片 (BPo=7.00x102， 中 性 图 片 的 态度 得 分 高 于 消极 图 片 (BFio= 3.60x10)。 当 前 数据 存 


在 极 强 的 证 据 支 持 图 片 效 价 和 饮品 种 类 间 交 互 作用 的 存在 (BFina= 2.07x109)。 


3.4.2 ”实验 设计 为 混合 设计 


示例 数据 。 举 重 速度 采用 的 是 2x3 混合 设计 。 自 变量 是 抓 握 类 型 (Grip) 和 负重 (RM)， 


因 变 量 为 举重 速度 。 该 数据 需 在 https://jasp-stats.org/teaching-with-jasp/ 中 进行 下 载 。 


操作 步骤 。 首 先 在 JASP 中 打开 数据 ， 然 后 在 ANOVA 面板 中 选择 “Bayesian Repeated 


Measures AVOVA”。 之 后 需要 进行 以 下 步 又 ( 见 图 9): 第 一 ， 设 置 重复 测量 因子 并 对 因子 的 


不 同 水 平 进行 命名 ， 并 将 抓 握 类 型 放 入 “Between Subject Factor” P; 第 二 ， 在 “Bayes Factor” 
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chinaXiv 


选项 框 中 选择 BFio 作为 要 


“compare to null model”; 


BFina; 第 五 ， 由 于 贝 叶 斯 ANOVA 没有 简单 效应 分 析 的 模块 ， 


了 简单 效应 分 析 。 


第 四 ， 在 “Tables” 选 项 机 


输出 的 贝 叶 斯 因 


¥ Bayesian Repeated Measures ANOVA 


Bayes Factor Tables 
O BF. @ Efeds 
BE a Across all models 


Repeated Measures Factors 


RM30 30 
RM50 0 
RM70 70 


Between Subject Factors 


& Grp 


Covariates 


Bayesian Repeated Measures ANOVA Y 


Model Comparison 


因此 需要 通过 


子 的 形式 ; 第 三 ， 在 “order” 选 项 框 中 选择 


匡 中 多 选 “Across matched models” 来 计算 


由 叶 A 


Models PM) BFM 
RM + Grip + RM + Grip 0.200 0.997 1232266 1.000 
RM + Grip 0.200 0.003 0013 0.003 2.404 
x a 0200 6.200e-5 2480e-4 6220e-5 1.859 
0200 4684e-17 1874e-16 4699e-17 1.905 
a model (incl, subject and random slopes) 0200  2066e-17 82649-17 2073e-17 1,629 


Note. All models include subj 


Analysis of Effects Y 


ject, and random slopes for all repealed measures factors. 


Effects P(incl) Piexcl) Plincldata) P(excldata) BFna 
4 RM 0.400 0.400 0003 6750e-17 4793e+13 
Grip 0.400 0.400 0.003 6. 2006-5 51.190 
RM & Grip 0.200 0.200 0.997 0.003 314 084 
Note. Compares models that contain the effect to equivalent models sipped of the effect. 
Higher-order inter: re excluded. Analysis suggested by Sebastiaan Mathdt. 


图 9 使 月 


结果 汇报 。 贝 叶 斯 方差 分 析 的 结果 显 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011), 


持 抓 握 类 


Post Hoc Tests 


Post Hoc Comparisons - RM 


Prior Odds Posterior Odds error % 

30 50 0.587 20.362 1.812e-4 
70 0.587 5.135e+8 TAAA 8 14736-11 

50 70 0.587 6918 088 20240-8 


Note. The posterior odds have been comected fon multiple testing by foan nT 05 the pr tor: 


probability that the null hypothesis holds across all ct 
1997). Individual comparisons are based on 


H JASP 进行 二 


lestfall, Johnson, & Uti 
the default t-test with a Cauchy (0, r = 1/ sar) 
prior. The “U" in the Bayes factor denotes that it is uncorrected. 


因素 重复 测量 方差 分 析 的 操作 截屏 


参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


当前 数据 存在 非常 强 的 证 据 文 


型 主 效应 的 存在 (BFino = 51.19)， 传 统 抓 握 方式 的 举重 速度 快 于 反 握 。 当 前 数据 存 


在 极 强 的 证 据 支 持 负 荷 主 效应 的 存在 (BFiau = 4.79x105) 的 存在 。 事 后 检验 发 现 ，30% 负 蓓 


的 举重 速度 快 于 50% 负 荷 (BFio= 34.66) 和 70% 负 和 荷 (BFio = 8.74x108)，50% 负 蓓 的 举重 速度 


快 于 70% Gai (BF io = 11777.45)。 当 前 数据 存在 极 强 的 证 据 支 持 抓 握 方式 和 负荷 间 交 互 作用 


的 存在 (BFisa = 314.08)。 


4 讨论 


本 文 介绍 了 贝 叶 斯 ANOVA 的 基本 原理 ， 特 别 是 使 用 线性 模型 并 进行 模型 比较 的 思维 
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方式 。 随 后 结合 实验 心理 学 常用 的 五 种 实验 设计 ， 本 文 展示 了 如 何在 JASP 中 进行 贝 叶 其 


ANOVA 及 如 何 汇报 并 解释 统计 结果 ， 为 贝 叶 斯 ANOVA 的 使 用 提供 示例 。 


本 文 主要 关注 如 何 理解 贝 叶 斯 ANOVA 以 及 如 何在 JASP 中 进行 操作 ， 因 此 未 深入 对 以 


下 内 容 进 行 讨 论 。 第 一 ， 先 验 分 布 的 参数 设 定 。 本 文 的 所 有 示例 均 使 用 JASP 的 默认 设 定 


(Prior: r scale fixed effects = 0.5, r scale random effects = 1, r scale covariates = 0.354; Model Prior: 


Uniform)， 当 研究 者 觉得 有 必要 进行 修改 时 ， 可 在 Additional Options 中 进行 修改 。 由 于 修 


改 这 些 先 验 本 身 即 是 对 混合 线性 模型 中 先 验 的 修改 ， 研 究 者 可 使 用 R 中 的 brms 包 来 构建 由 


第 二 ， 要 对 参数 先 验 和 模型 先 验 


叶 斯 混合 效应 模型 ( 潘 晚 坷 等 , 2022)， 该 方式 也 更 加 灵活 。 


ANS 


进行 区 分 ， 虽 然 本 文 在 原理 部 分 进行 了 介绍 ， 但 这 仍然 是 容易 混淆 之 处 ， 需 要 研究 者 特别 


注意 。 第 三 ， 汇 报 BF 时 要 汇报 实际 数值 ， 而 非 简 单 的 与 特定 阔 值 进行 比较 (Schmalz et al., 


= 
d 
Q) 


2021)。 例 如 ， 不 推荐 仅 汇 报 BF>3， 而 是 汇报 具体 数值 。 如 果 需 要 更 为 全 面 的 了 解 在 JASP 


A 
| 


1 
m 


2D 


N Gija 、 ue Š Ay ya ae. 
= 中 进行 贝 叶 斯 统计 的 细节 ， 可 以 参考 van Doorn 等 (2021) 的 文章 。 
N 


> van den Bergh 等 (2020) 认 为 贝 叶 斯 ANOVA 还 存 以 下 两 个 需要 注意 的 问题 : 第 一 ， 贝 叶 


y 


斯 ANOVA 与 频率 学 派 NHST 存在 同样 的 问题 ， 即 当 模 型 被 错误 指定 并 且 残 差分 布 是 非 正 


态 分 布 时 ， 其 结果 可 能 会 出 现 偏差 。 该 问题 可 通过 使 用 不 指定 残 差分 布 的 ANOVA( 例 如 ， 


Kruskal-Wallis 检验 ) 或 者 指定 残 差分 布 来 解决 ( 需 在 Stan 或 JAGS 中 进行 ); 第 二 ，BF 的 计算 


会 受到 模型 内 参数 先 验 分 布 的 影响 。BF 实质 上 是 两 个 模型 边际 似 然 的 比值 ， 先 验 分 布 的 变 


Lr 


化 必然 会 导致 BF 的 变化 (Schad et al., 2022; Tendeiro & Kiers, 2019)。 在 复杂 的 实验 设计 


研究 者 在 了 解 并 设置 合适 的 参数 先 验 分 布 是 困难 的 。 因 此 ， 本 文 推荐 使 用 JASP 默 认 的 先 验 


分 布 参数 设 定 。 


贝 叶 斯 统计 的 优势 足以 令 心 理学 等 相关 学 科 的 研究 者 将 注意 从 频率 学 派 ANOVA 转移 


到 贝 叶 斯 ANOVA( 胡 传 鹏 等 , 2018; 李 贵 玉 , 顾 昕 , 2021; 许 岳 培 等 , 2022; 郑 元 瑞 , HAE, 


17/24 


chinaXiv:202209.00140v3 


2023)。 贝 叶 斯 ANOVA 可 以 起 到 补充 和 检验 频率 学 派 ANOVA 结果 的 作用 ， 从 而 为 研究 结 


果 提 供 更 为 有 力 的 支持 (Hoijtink et al., 2019). BF 通常 会 使 研究 者 得 出 和 jp 值 一 致 的 结果 。 


当 结 果 不 一 致 时 ， 建 议 研究 者 按 以 下 流程 对 结果 进行 报告 :1. 详 细 地 报告 BF 和 值 的 结果 


及 各 自 所 代表 的 含义 ;， 2. 研究 者 在 做 出 结论 时 要 持 有 谍 慎 态度 ， 避 免 对 结果 的 过 度 解 读 。 


当 这 两 种 统计 方法 得 出 不 一 致 的 结论 时 ， 可 能 有 多 个 原因 ， 例 如 ， 当 前 研究 的 效应 量 不 够 


稳定 ， 或 者 当前 的 数据 不 满足 ANOVA 分 析 的 前 提 预 设 。 这 提示 研究 者 需要 反思 当前 研究 ， 


包括 样本 量 是 否 足够 、 在 实验 中 对 无 关 变 量 的 控制 情况 等 。 同 时 ， 这 也 启发 研究 者 要 在 收 


集 数据 前 确定 关键 效应 的 量 值 。 基 于 此 ， 贝 叶 斯 因子 序列 分 析 为 研究 者 提供 了 一 个 新 的 分 


析 视 角 。 该 方法 要 求 研究 者 在 实验 数据 收集 开始 前 ， 就 要 根据 研究 设计 或 假设 确定 关键 效 


应 。 在 保证 研究 获得 足够 证 据 的 前 提 下 ， 设 置 停止 收集 数据 的 规则 。 在 数据 收集 的 过 程 中 ， 


研究 者 可 以 对 数据 进行 持续 地 分 析 ， 直 到 BF 和 样本 量 达 到 阔 值 ， 就 可 以 停止 数据 收集 ( 详 


ANS 


步骤 和 实现 教程 可 参考 : 郑 元 瑞 , 胡 传 鹏 , 2023). 


BF 会 比 p 值 更 加 保守 并 提供 更 直观 的 信息 (Dong & Wedel, 2017)。 更 为 重要 的 是 ， 随 着 


贝 叶 斯 统计 的 应 用 以 及 相关 软件 和 软件 包 的 开发 (例如 ，JASP、Stan、JAGS、BayesFactor、 


brms, bain, BANOVA 和 PyMC 等 )， 研 究 者 能 更 加 快速 、 方 便 地 开展 贝 叶 斯 分 析 。 为 了 贝 


叶 斯 分 析 的 稳定 性 和 可 重复 性 ， 研 究 者 也 提出 了 一 系列 分 析 指 南 (Schad et al., 2022; van 


Doom et al., 2021)。 总 之 ， 贝 叶 斯 统计 的 应 用 能 够 为 解决 心理 学 的 可 重复 危机 做 出 重要 贡献 。 
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The implementation of Bayesian ANOVA in JASP: A practical 


primer 


WANG Yunhong!, Don van den Bergh’, Frederik Aust”, Alexander Ly’, Eric-Jan 
Wagenmakers’, HU Chuanpeng4 
(‘Department of Psychology, School of Education, Shanghai Normal University, Shanghai 
200234, China) 
(Department of Psychological Methods, University of Amsterdam, 1018 VZ Amsterdam, The 
Netherlands) 
(Centrum Wiskunde & Informatica, 1090 GB Amsterdam, The Netherlands) 


(‘School of Psychology, Nanjing Normal University, Nanjing, 210024, China) 


Abstract: The application of Bayesian statistics to hypothesis testing - Bayes factors - is increasing 
in psychological science. Bayes factors quantify the evidence supporting the competing hypothesis 
or model, respectively, thereby making a judgment about which hypothesis or model is more 
supported by the data based on its value. The principles and applications of Bayes factor for ANOVA 
are, however, not available in China. We first present the theoretical foundation of Bayesian ANOVA 
and its calculation rules. It also shows how to perform Bayesian ANOVA and how to interpret and 
report the results of five common designs (one-factor between-group design, one-factor within- 
group design, two-factor between-group design, two-factor within-group design, and two-factor 
mixed design) using example data. Theoretically, Bayesian ANOVA is an effective alternative to 
conventional ANOVA as a powerful vehicle for statistical inferences. 
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